Байесовские интегрирующие технологии
на основе интеллектуальных и мягких
измерений
С. В. Прокопчина
Санкт-Петербургский государственный электротехнический университет “ЛЭТИ”,
Научное общественное объединение “Ученые за экологию”
E-mail: svp@svp.spb.ru
Abstract — The new class of the integrant information technologies – Bayesian Inregrant Technologies (BIT) for various types of data and knowledge integration, based on the Regularizating Bayesian Approach and methodology of Bayesian Intelligent and Soft Measurement, is suggested. Parametrical (for data integration), functional (for models integration), multy-factors (for recognition and interpretation of the situations) BIT as well as metrological aspects of obtaining decisions and possibilitive ways to decisions risk control are considered .The analytical equations for these types of BIT on concept level are given. The “probability-possibility” integrant technologies , features of BIT for models integration, making decisions under conditions of great a priory uncertainty on the basic of BIT, definition of the situations and main influence factors are discussed. BIT-versions for integration of the perspective information technologies and distributed information recourses, as well as version of the “active” INTERNET technology – BIT-INTERNET for distributed decisions support systems (DSS) are briefly considered.
Развитие информационных технологий и систем в направлении создания средств интеграции разнообразных данных и знаний с целью оптимизации решения прикладных задач в природопользовании, промышленности, управлении территориями, экологии, экономике, финансовой и социальной сферах обусловлено, с одной стороны, значительной неопределенностью имеющейся информации (при постановке задач, выборе критериев, ограничений, методической и экспериментальной баз), с другой стороны, требованиями получения максимально достоверных, объективных, своевременных решений.
K настоящему времени созданы многочисленные разноплатформные базы данных, расчетные методики и модели, распределенные по научным, ведомственным и производственным организациям. Системный подход к оценке ситуаций и состояний объектов природной и техногенной сред обусловливает необходимость интеграции модельных представлений различных физических и информационных процессов и явлений. Так, например, при определении степени надежности сложного техногенного комплекса (предприятий по добыче и переработке природных ресурсов, линий электропередач, газо-нефтепроводов, атомных электростанций, теплоэлектростанций и др.) необходимо интегрировать модели влияния окружающей природной среды (геодинамические, гидрологические, климатические процессы) и ее техногенной насыщенности (виды и степень надежности эксплуатируемых технических объектов, наличие мест выработки полезных ископаемых, строительство новых сооружений), а также характеристик социально-экономической сферы. Однако, несмотря на имеющиеся перспективные технологии по извлечению и транспортировке информации и типизированность основных прикладных задач оценивания, контроля и управления, для получения практически приемлемого решения конкретной прикладной задачи каждый раз необходима достаточно длительная и трудоемкая работа по созданию информационной технологии решения задачи в целом, обеспечивающей сбор и согласование имеющихся данных и моделей, а также реализацию расчетных и аналитических этапов, которая выполняется в рамках специального проекта группой специалистов-разработчиков. Многие этапы такой работы могли бы быть с успехом автоматизированы на основе применения интегрирующих технологий. Первым шагом в этом направлении явились технологии CLIENT-SERVER, обеспечивающая на основе серверов баз данных быстрый доступ пользователей к распределенным информационным ресурсам. Однако возможности таких технологий в настоящее время весьма ограничиваются недостаточностью интеграции только данных ( а не совокупности данных и знаний), невозможностью управления качеством и риском получаемых решений, неавтоматизированностью процесса адаптации и развития технологий в меняющихся информационных условиях, например, при добавлении нового источника информации (нового измерительного прибора, новой базы данных, новых модельных представлений).
Разработки интегрирующих многоплатформных технологий, как было продемонстрировано на выставке новейших информационных технологий CeBIT-99 (Hannover, Germany), ведутся в настоящее время в ряде отечественных и зарубежных фирм , таких как MICROSOFT, SOFTWARE AG (информационные технологии для реализации многоплатформных возможностей TAMINO, BOLERO), SIMENS ( методы и технологии создания интеллектуальных систем). Однако отсутствие соответствующей математической основы для разработки интегрирующих технологий заранее определяют ограничения этих разработок и фрагментарность их приложений.
Основные принципы интеграции информации на основе регуляризирующего байесовского подхода (РБП) и его технологий.
Интегрирующие свойства байесовского подхода являются принципиальной основой для разработки информационных технологий свертки информации, ее преобразований на многомодельной основе, генерации гибких стратегий управления, комплексной оценки ситуаций и разработки сценариев их оптимального развития. Основным препятствием к широкому использованию этого подхода до настоящего времени являлась неустойчивость и чувствительность байесовских оптимальных решений при неточной, неполной, нечеткой информации.
Методологическая основа РБП представлена в работах [1, 2, 3]. Данная модификация байесовского подхода направлена на получение устойчивых оптимальных байесовских решений в условиях значительной неопределенности информации. Информационные технологии на основе РБП строятся на основе шкал с динамическими ограничениями (ШДО), которые, кроме основных шкал для представления информации (числовой или лингвистической), имеют сопряженные универсальные шкалы для передачи информации на следующие этапы ее обработки.
Универсальные ШДО имеют типизированную структуру носителя и допустимого множества отношений для каждого типа решения, стандартную форму представления информации, позволяющую абстрагироваться от конкретных единиц представления информации. Они представляют собой порядковые шкалы с допустимыми отношениями эквивалентности и порядка и стандартными наборами реперов в виде терм-множеств (обычно 9 элементов для обеспечения приемлемой практической точности решений). К числу таких шкал относятся несколько видов типовых шкал для оценки состояний объектов, значений параметров технических систем и степени интенсивности проявления свойств природных компонентов окружающей среды; интерпретации, динамики и тенденций развития ситуаций , а также генерации рекомендаций по управлению ситуациями и сценариями их реализации с учетом всех значимо влияющих факторов внешней среды.
Значения параметров и характеристик свойств сложных объектов обычно определяются со значительной степенью неопределенности, что обусловливает целесообразность привлечения дополнительной информации об объектах и их свойствах. Интеграция такого типа данных может производится на параметрических шкалах ШДО по технологиям БИТ в соответствии с формой представления и степенью неопределенности информации. Данные технических измерений с использованием приборов и информационных систем при этом могут быть на формальной основе методологии РБП проинтегрированы с экспертными оценками и расчетными значениями. Так, при имеющейся совокупности потоков данных {Х
i}, i=1,…I на основании БИТ-технологий можно сформировать интегральный поток данных XI(о) :где X
I={xij|qij}-поток данных i-ого типа, состоящий из J элементов xij, полученных при условиях qij={aij,mij,oij}, включающих: aij - априорную информацию об xij, mij – метрологические требования и характеристики, oij – ограничения и допущения, имеющие место при формировании xij.В качестве информационных потоков данных рассматриваются: результаты измерений средствами информационно-измерительных систем; данные статистической отчетности, анкетирования или учета; результаты моделирования , расчетные данные, результаты функциональных преобразований (трансформированные экспериментальные данные) измерительной или вычислительной информации; физические константы; картографическая информация, видео-, аудио-информация; экспертная информация; фактологическая информация. В соответствующих программных модулях БИТ-технологий такие потоки данных представляются, например, как OLE- объекты.
Степень неопределенности потоков данных, априорные знания о них и ограничения представляются совокупностью условий интеграции потоков Q
I(o),Qi.Свертка информации о значении элементе x
ij, i=1,…I производится по модифицированной формуле Байеса:где h
kj(o) – интегральная (для совокупности потоков информации XI(o)) регуляризирующая байесовская оценка (РБО); hkij – РБО для Xi потока данных.Метрологическое обоснование каждого типа информационных потоков Xi ведется в соответствии с разработанными формализованной методической базой метрологии БИИ и принципами преобразования комплексов метрологических характеристик [1,3], которые включают показатели точности, надежности (уровней ошибок 1 и 2 рода) и байесовской достоверности для каждой РБО. Свертка комплексов метрологических характеристик {MX}kij РБО hkij выполняется в соответствии со следующим выражением:
Закон распределения общей погрешности f(D
hkj) определения интегральной числовой оценки значения физической величины для БИТ-технологий определяется как композиция законов распределения погрешностей f(D hkij) определения РБО hkij для отдельных потоков данных в виде их свертки:При использовании БИТ-технологий в автоматическом режиме решается задача определения многомерного закона распределения f(D hkj) в аналитическом виде, сложность которой общеизвестна. В рамках реализации БИТ-технологий свертки законов распределений разработана технология аппроксимации апостериорного распределения кривыми из системы Пирсона (1,2). Круг аппроксимирующих распределений может расширяться за счет включения новых семейств распределений. При идентификации распределения используются вся имеющаяся априорная информация при полном метрологическом контроле получаемых результатов, что позволяет при заданных требованиях к качеству аппроксимации снизить необходимый для этого объем выборки.
Для интеграции лингвистических РБО hkij(l ) в БИТ-технологиях применяется модифицированная формула Байеса для свертки функций принадлежности hkij(l ) m A(hkij(l )|XI(o))
Интеграции вероятностной и возможностной информации производится на основании методологии РБП и БИИ в виде сопряженной регуляризированной байесовской оценки в соответствии с формулой:
h(ou)=hkj(ol )* hkj(o), где
Методологическая основа свертки такого рода рассмотрена в [1].
Уместно отметить, что для практических задач смена логики вывода решения может играть важную роль при индексации ситуации по степени ее значимости. Примеры рассмотренные в [4], позволяют рекомендовать использование логики Заде и соответствующего аппарата вычислений при необходимости тщательного, детального рассмотрения всех возможных сценариев развития событий и ситуаций, а “жесткие” логики (типа логики Лукашевича) могут быть рекомендованы для решения задач в условиях значительной неопределенности, в которых необходимо получить единственное (или “слабо” размытое), наиболее целесообразное решение.
Сопряженная шкала числовых значений и лингвистических оценок состояний объектов наблюдения– статическая ШДО, представлена на рисунке 1, который иллюстрирует определение интегральной оценки значения концентрации примеси метана, полученной на основании интеграции расчетных данных и априорных экспертных оценок ( на рисунке определена как “текущая” ШДО). Оценка получена на числовой шкале как нечеткое значение концентрации примеси метана, а на интегральной апостериорной лингвистической шкале как нечеткая оценка степени проявления этого компонента воздушной среды при транспортировке ресурсов газа.
Рис. 1. Определение интегральной оценки концентрации примеси метана
на основе БИТ-технологий
Носитель интегральной универсальной лингвистической шкалы представляют реперы экологического нормирования ( “норма”, “ниже нормы”, “выше нормы”) содержания примеси метана в воздушной среде, что (при использовании этого типа шкалы для оценки степени проявления других примесей) позволяет, абстрагируясь от единиц измерения компонентов воздушной среды, получить интегральную оценку состояния воздушной среды по совокупности рассматриваемых примесей, определяя ее по формуле 1 на следующем иерархическом уровне обобщения информации.
Методология функциональных байесовских интеллектуальных измерений, рассмотренная в [1,2], послужила основой для создания математической базы для построения БИТ-технологий для обобщения функций и модельных представлений. Таким образом, процесс обобщения знаний и реализация принципа многомодельности могут быть реализованы на основе БИТ-технологий оценки динамики , прогноза, ретроспективы развития процессов и ситуаций. Для регуляризации решений в БИТ-технологиях такого типа используется специальный вид универсальной интегрирующей шкалы - динамической лингвистической ШДО. Примеры таких шкал приведены в [1,3,5] и в ряде работ по теории и практике РБП и БИИ, включая настоящий сборник. Особое практическое значение интеграция моделей и потоков данных имеет в условиях неопределенности информации, ее неполноты, неточности. Применение БИТ-технологии в таких условиях особенно актуально, так как интегрирующие свойства их необходимы для восстановления пропущенных данных , уточнения рещений, составление практически приемлемых прогнозов, ретроспективных оценок и сценариев развития ситуаций. В докладах настоящего сборника приводятся убедительные примеры эффективности БИИ и БИТ-технологий при решении широкого круга задач экономики, природопользования, распределенного индустриального производства, финансов, охраны окружающей среды (например, доклады А.С.Пиотровского, Р.А.Фокина, О.Г.Иванова, А.В.Ивановой, С.Ж. Филиппова, С.И.Крамарь, С.В.Бровчака и др.).
Рис. 2. Нечеткая модель корреляционной функции на основе БИТ
Системные или ситуационные БИТ-технологии предназначены для выявления типа и интерпретации ситуаций, а также сценариев их развития на основе выявления и свертки многочисленных влияющих на состояние объектов факторов внешней среды. Решение в виде регуляризированной байесовской оценки ситуации получается на основе следующей зависимости:
hkj(cou)=hkj(ou)* hkj(mou),
где h
kj(cou), hkj(ou), hkj(mou) – сопряженные РБО ситуации, параметров и результатов моделирования на основе комплекса моделей {hzj(mou)}, z – число интегрированных по БИТ-технологиям расчетных моделей.Рис. 3. Интерпретация ситуации на основе БИТ-технологий
На рисунке 3 иллюстрируется оценка и интерпретация экологического состояния воздушной среды промышленного региона. Определяется степень безопасности состояния, тенденции ее развития, альтернативные оценки ситуации (нечеткое оценивание), значимо влияющие факторы, рекомендации по возможным способам ее корректировки. Можно рассмотреть влияние факторов детальнее, если перейти на предыдущие нижние уровни дерева факторов и тем самым полнее интерпретировать причины возникновения данной ситуации.
Результатом реализации БИТ-технологий на уровне генерации управляющих рекомендаций являются гибкие стратегии управления производством и использованием ресурсов.
Принципиальным свойством БИТ-технологий является параллельное с процессом основных преобразований информации непрерывное метрологическое обоснование, что придает им измерительный характер. Для функциональных (модельных) и системных (ситуационных) БИТ-технологий на каждом этапе этих технологий производятся преобразования комплексов метрологических характеристик на основе формализованного подхода, приведенного в [1].
Формализованная метрологическая основа БИТ-технологий позволяет определять степень практической приемлемости получаемых оценок, прогнозов, рекомендаций, обеспечивает возможность управления качеством решений на основе согласованного решения прямой и обратной задач метрологии БИИ и БИТ. Эти же свойства БИТ-технологий создают принципиальную основу и методическую базу для задач инвестирования и оценки риска новых проектов, реконструкции предприятий, расширения производств, строительства сооружений , развития территорий.
Перспективы развития БИТ-технологий
Современные информационные системы все чаще имеют распределенную структуру. Это в первую очередь обусловлено характером решаемых задач которые вкючают задачи сбора информации от разнесенных в пространстве источников, мониторинг компонентов различных региональных экосистем, управление распределенным индустриальным производством и др. На уровне информационных технологий БИТ-технологии определили новые системные решения для распределенных информационных ресурсов и средств их получения, транспортировки и распределения, обеспечивая открытый характер технологий уже на уровне методологии .
Бит-технологии позволяют объединить несколько информационных технологий для реализации фрагментов сложных науко- и информационноемких прикладных задач.
Корпоративный проект по созданию технологической базы для быстрой разработки систем поддержки принятия решений в условиях неопределенности, получивший в 1999 году грант Министерства науки и технологий Российской Федерации и объединяющий в составе разработчиков 11 лучших российским фирм-производителей программной продуктов является ярким примером интегрирующих системных возможностей БИТ-технологий, на основе которых производится соединение в единую информационную среду отдельных перспективных технологий извлечения знаний, обработки нечетких данных и текстов, транспортировки информации, реализации многоязычных версий, использование высокопроизводительных средств с целью получения максимально эффективного решения указанных выше прикладных задач. Программная реализация БИТ-технологий предполагает наличие нового типа управляющих системных устройств – сервера интеграции технологий.
Перспективной версией БИТ-технологий является технология БИТ-ИНТЕРНЕТ. Появление ее обусловлено стремительным развитием информационной базы ИНТЕРНЕТ, которая в настоящее время не является активной в смысле получения не только данных и описаний, но и генерируемых по запросу пользователя знаний. Технологии БИТ-ИНТЕРНЕТ позволят создать новый тип общения с ИНТЕРНЕТ( активную ИНТЕРНЕТ) , при котором будут возможны получение оценок, прогнозов ситуаций и рекомендаций на основе быстрого обобщения с многочисленными источниками данных при применении самых современных технологий их обработки и интерпретации. Применение такого рода технологий позволит не только расширить возможности познания различных сфер жизни планеты, но и на основе повышения качества, своевременности, скоординированности решений важнейших практических задач создать условия для устойчивого развития всех компонентов глобальной экосистемы.
Литература
[1] Недосекин Д.Д., Прокопчина С.В., Чернявский Е.А. Информационные технологии интеллектуализации измерительных процесов. СПб.: Энергоатомиздат, 1995. 187 с.
[2] Прокопчина С. В. Организация измерительных процессов в условиях неопределенности. Регуляризирующий байесовский подход. СПб. Сборник докладов Международной конференции по мягким вычислениям и измерениям SCM-98, 22-26 июня 1998, т.1 с.30-44.
[3] Прокопчина С. В. Концепция байесовской интеллектуализации измерений в задачах мониторинга сложных объектов// Новости искусственного интеллекта, М., №3, 1997, с.7-56.
[4] Prokopchina S.V., Averkin A. N. The short essue of the soft measurement concept. SPb., Hidrometeoizdat, 1997, 38pp.
[5] Прокопчина С. В. Системы мониторинга и поддержки принятия решений в природоохране и природопользовании, СПб., 1998, 110 с.
Site of Information
Technologies Designed by inftech@webservis.ru. |
|